寫了幾個政府開放資料,發現滿多資料集屬於.json的,一開始不知道怎麼處理,後來發現其實很方便。甚至不用下載資料集,直接用程式碼就可以打開資料集了。
library(jsonlite)
library(tidyverse)
data <- fromJSON("https://od.cdc.gov.tw/eic/Dengue_Daily_last12m.json")
as.tibble(data)
View(data)
順便在跟大家交流一個很好用的as.tibble(),因為不知道自己下載下來的資料集有多大,貿然打開絕對不是一個好決定,因此可以用head(data)只看前幾筆的資料,或是改變資料型態用as.tibble(data) 他不但會只顯示前幾行,並且會告訴你資料的型態為何。
library(lubridate)
for(i in 1:3)
data[,i] = ymd(data[,i])
data[,10] = as.numeric(data[,10])
data = as.tibble(data)
data
改過之後就變成了日期型態的資料以及數值型態的資料了。
如果可以的話我想用這筆資料在最近進行PCA主成分分析,做為鐵人賽最後的ending。
資料來源:政府開放資料 - 登革熱近12個月每日確定病例統計 https://data.gov.tw/dataset/21026